期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 英汉机器音译系统对比研究
高恩婷, 段湘煜
北京大学学报自然科学版    2017, 53 (2): 287-294.   DOI: 10.13209/j.0479-8023.2017.039
摘要920)   HTML20)    PDF(pc) (471KB)(411)    收藏

针对机器音译的两种主要方法 —— 传统的基于统计的方法和目前流行的基于深度神经网络的方法, 分别使用两种典型系统进行研究。实验结果显示, 基于统计的方法和基于深度神经网络的方法取得的音译质量在评测指标上相当, 但在具体音译结果上各系统间呈现不一致的输出。使用系统融合的方法来实现各系统间的优势互补。实验结果显示, 系统融合的方法显著优于单系统的音译质量。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
2. 面向词性标注的多资源转化研究
高恩婷,巢佳媛,李正华
北京大学学报(自然科学版)   
摘要973)      PDF(pc) (568KB)(215)    收藏
利用多资源转化方法进行词性标注研究, 旨在将源端资源的标注进行转化, 以符合目标端标注规范, 进而将转化后的资源与目标资源合并, 增大训练数据规模。做了两方面创新: 在转化过程中, 额外利用指导特征的置信度信息; 在转化后的资源中, 用模糊标注表示方法减少错误标注。实验表明, 利用置信度信息能有效帮助转化, 而模糊标注表示方法的影响不大。
相关文章 | 多维度评价 | 评论0